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التفرعية والحوسبة‎ 


الحوسبة التفرعية هي شكل من اشكال الحوسبة التقليدية ولكن بفارق انه يتم القيام بعدة مُعالجات خلال واحدة الزمن " دورة معالج › ثانية › ...الخ" . 
يعتمد مفهوم الحوسبة التفرعية على ان مشكلة معينة يمكن ان يتم تقسيمها الى مشاكل جزئية اصغر ويتم معالجة المشاكل الجزئية على التفرع "التوازي 
" وتتميز المشاكل الجزئية بالاستقلال فيما بينها . يوجد العديد من انماط الحوسبة التفرعية : التفرع على مستوى البت اط » على مستوى التعليمات 
»على مستوى المعطيات وعلى مستوى المهام .ان مفهوم التوازي في عملية المعاجلة تم توظيفه لسنين عديدة في مجال الحواسيب عالية الاداء إعز١۸‏ 
gl Performance Computers‏ اختصاراً HPC‏ ولکن الاهتمام بالتفرع اخذ يتزايد في الحواسيب العادية الاداء وذلك بسبب كسر حواجز ترددات 
عمل المعالج وغيرها من العوامل . فلقد امسى نموذج الحوسبة التفرعية النموذج المسيطر في معماريات الحواسيب بشكل معالجات متعددة النوى وذلك 
بالنسبة للحواسيب العادية وامسى نمط البرمجة التفر عي Concurrent Programming Methodology‏ حاجة اساسیة للتعلم. 


يمكن تصنيف الحوسبة التفرعية استنادا الى المستوى الذي نتعامل معه على التفرع كما اننا نجد ان للحوسبة التفرعية اشكال عديدة فيمكن ان نجد تفرع 
مدعوم بشكل عتادي كالمعالجات متعددة النوى او عدة معالجات ضمن جهاز واحد او على مستوى المعالج الواحد فنحن نتكلم عن مفهوم ال sئلdجع1۲‏ 
الذي يعطي الإيهام بان المعالج الواحد يعالج عدة امور بنفس الوقت كما نجد مفهوم الحوسبة على مستوى الاجهزة فنجد عدة حواسب تشكل ما يسمى بال 
لت او القيكة وما رتضمنه ذلك من ادل للرسائل بين المعالجات ,او الققرع الدعرم برمجيا وها يقابله من اذارة اللياسب. 


رات فعا آل فد لى شر الخرة ار قير م اك كر ن ك اک ك ل ن ای ا اا 
يقدم اصناف جديدة من الاخطاء البرمجية وعںط .كما انه توجد مشاكل عديدة كمشكلة الاتصال بين المعالجات والمزامنة بينها كل هذا يعتبر من 
الصعوبات التي تواجه المبرمج عندما يريد كتابة برنامج بشكل تفرعي .كما يجدر الذكر بان السرعة المثلى لقياس زمن تنفيذ برنامج في حالة حوسبة 
تفرعية يمكن معرفته من قائون امبدال التالي : 


_ Pp 
Sp) = (p-1)f+1 


حيث م عدد المعالجات و f‏ الجزء اللازم من المسالة المراد حلها والذي لا يحل الا تسلسلياً . 


التفرع او التوازي على مستوى المهام 


يعرف ايضا بالتفرع على مستوى التوابع والتحكم » وهو شكل من اشكال التفرع للكود البرمجي بواسطة عدة معالجات في بيئة حوسبة تفرعية .ان 
التوازي على مستوی المهام یرکز على المهام process‏ او النياسيب المنفذة والموز عة على الحواسيب او المعالجات المختلفة . 


في نظام يحوي عدة معالجات فان توازي المهام يمكن تحقيقه عندما يقوم كل معالج بتنفيذ مهمة (sوععهإم‏ ٣ه‏ ١جه۲ط)‏ بناء على معطيات واحدة او 
مختلفة .كما ان المهام المنفذة تتصل فيما بينها من اجل ضمان عدم تعارض المعطيات . 


كمثال بسيط اذا كنا نشغل رماز مصدري على نظام يحوي معالجين | وب في بيئة تفرعية ونحن نريد ان ننفذ المهام | وب فمن الممكن ان نخبر المعالج 
| بان يقوم بتخديم المهمة | والمعالج ب بان يقوم بتخديم المهمة ب على التوازي ٠‏ وبالتالي ننقص من زمن تنفيذ البرنامج تقريبا الى النصف . 


يركز التوازي على مستوى المهام طبيعة المعالج التفرعية على عكس التوازي على مستوى المعطيات . 


التوازى على مستوى المعطيات : 


ان التوازي على مستوى المعطيات يعرف ايضا بالتوازي على مستوى الحلقات هو شكل من اشكال التفرع في المعالجة في بيئة تحوي عدة معالجات 
.يركز التوازي على مستوى المعطيات على المعطيات الموزعة ما بين عقد المعالجة في البيئة التفرعية . في نظام يحوي عدة معالجات ينفذ مجموعة 
واحدة من التعليمات 5|10 ءفان التوازي على مستوى المعطيات يمكن تحقيقه عندما يقوم كل معالج بالقيام بنفس المهمة على عدة كتل من المعطيات 
الوزعة .في بعض الحالات فان مهمة او نيسب واحد يتحكم بجميع مسار والعمليات المتعلقة بالمعطيات . 


كمثال توضيحي : لنعتبر ان لدينا نظام يحوي معالجين المعالج | والمعالج ب في بيئة تفرعية ونريد ان نقوم بمهمة محددة على بعض المعطيات د . من 
الممكن ان نخبر المعالج ١‏ بان يقوم بمعالجة جزء من المعطيات د وان نخبر المعالج ب بان يقوم بمعالجة جزء من المعطيات الاخر من د على التوازي 
.وبالتالي ننقص من زمن التنفيذ . وكمثال آخر اعتبر انك تريد جمع مصفوفتين في تطبيق التوازي على مستوى المعطيات المعالج | يمكن ان يجمع 
العناصر المتقابلة من المصفوفتين من الاعلى الى النصف بينما يقوم المعالج ب بالقيام بعملية الجمع من النصف الى اخر المصفوفة بين المصفوفتين 
بشكل متقابل . يؤكد التوازي على مستوى المعطيات على الطبيعة الموزعة للمعطيات كعملية معاكسة للتفرع على مستوى المهام . 


مفهوم وحدة المعالجة البيانية للأغراض العامة ا6۲6۲ 


ان وحدة المعالجة البيانية لغراض nlzllة computing on graphics processing units (GPGPU‏ purpose-lاGenera‏ او كما تعرف ب 
6۴ هي تقنية استعمال وحدة المعالجة البيانية ل6 التي كانت حصرا تقوم بمعالجة الحسابات من اجل العمليات البيانية بالمعالجة العامة شانها شان 
وحدة المعالجة المركزية .كانت وحدة المعالجة المركزية ل۲ هي التي تقوم بمعالجة الحسابات الاخرى فيما مضى وحتى انها كانت تقوم بمعالجة 
العمليات البيانية من قبل ظهور ل۲ . 


٠ ملاحظة‎ 


ان وحدات المعالجة البيانية ل۲ تعتبر بحد ذاتها وحوش معالجة فهي تحوي الكثير من انابيب المعالجة الصغيرة على عكس K۴‏ الذي يحوي عددا 
اقل بكثير وبالتالي جاءت فكرة وحدة المعالجة البيانية للأغراض العامة لكي تستفید من كلا من ل6۲ C۴18‏ بحيث نستفيد من ميزات كل منهمها في 
عمليات المعالجة ولا تترك ل6۲ فقط للأغراض البيانية . 


نشأة مفهوم ل6۲6۲ ؟ 
المرحلة الأولى - الحياة بسيطة 


قام الحاسوب على مفهوم ۷3)٣٥‏ ع ٣اا‏ ں۲ » وهو تصور جاءنا من الن تورينغ لجهاز الكمبيوتر .. خلاصته أن البيانات تنتقل من القرص الصلب 
إلى الذاكرة » ومن يقوم بمعالجة تلك البيانات شيء اسمه معالج واختصاره هو .. ل۳۴ مرت ثلاثين سنة على هذه الفكرة والتي أصبحت هي المعتمدة 
في كل جهاز حاسوب تقربباً في مطلع ثمانينات القرن الماضي. 


وفي العام 1990 ظهرت مكتبة ( أصبحت قياسية فيما بعد ) تحمل اسم ا6" هم0 . المكتبة الرسومية استفادت لاحقاً من " كونها قياسية " » وامسى 
كل صانع من صناع البطاقات الرسومية ل2۲٤‏ مها » يعمل 0٣‏ tiة†emenامصim‏ خاص به » يستفيد من قدرات العتاديات ٥٣2س‏ ١٣ج‏ لتسريع 
E Ta GECE A ROS DO E E AEE E E E E A e a E‏ 

الرسوميات " بالاستجابة لهذه التغييرات . 


البرامج الرسومية و الألعاب تصيب المعالج بإجهاد كبير » وعملية نقل البيانات من المعالج إلى الذاكرة الرئيسية إلى البطاقة الرسومية › تستهلك وقت 
وجهد » بل أن النموذج السابق يحمل اسم ع”أاممام-كع×|۴ » ويعني أن ۸61٠ص0‏ كمكتبة رسومية قائمة على أمور ثابتة ومبرمجة مسبقاً » بحيث 
تطلب من البطاقة الرسومية تغيير حالة ما .. فيظهر هذا على الشاشة .. فلا تستطيع مثلاً أن تتحكم بالمعادلة المسؤولة عن الشفافية .. فكل ما عليك أن 
تقوله هو : فل Enable Or Disable .Jفت J gİ‏ 


المرحلة الثانية - لا6۲ 


ظهرت أفكار جديدة لعلاج مشاكل البرامج الرسومية و الألعاب › وتتمحور حول مبدأً أساسي: 

لماذا لا نضع معالج خاص + ذاكرة خاصة للبرامج الرسومية المبنية على ا۸6 هم0 و أشباهها ؟ 

لماذا لا نسمح للمبرمج بكتابة معادلاته التي يريد تطبيقها على كل بكسل وعلى كل رأس ×ع† م۷ ؟ 

فظهر بالتالي الوحدة لمعالجة البيانيات الرسومية أل ع"أوومعه۴۲ كعنإمهاG‏ او اختصاراً ل6 وهو عبارة عن معالج مركزي خاص للمكتبات 
الرسومية مثل C6‏ و ]ا6عم0 و 0i١ ١130‏ .يوجد ضمن كرت الشاشة او الاظهار بهدف تقليل عمليات المعالجة المكلفة على وحدة المعالجة 
المركزية ل۴ .وهذا لا يعني الاستغناء عن ل٥‏ فمتلا عملية ضرب المصفوفات وعملية معالجة كل بكسل ومعظم العمليات التي تختص في عمليات 
الغرافيكس امست تعالج في معالج كرت الاظهار لا معالج لوحة الام ل۲٤‏ . 


المرحلة الثالثة ل٥6۲6‏ 

ظهرت فكرة وحدة المعالجة المركزية للأهداف العامة من قوة معالجات كروت الاظهار ل6۲ في المعالجة فبدلا من جعل ل6۲ مخصص فقط لمعالجة 
عمليات الغرافيكس المتطلبة لم لا يتم الاستفادة منها في جوانب تطبيقية اخرى 

من هنا ظهر مفهوم : ل6۲6۴ وهو ارا Purpose Graphics Processing Unit .. Î‏ اenera‏ يعني " الغايات العامة من وحدة المعالجة 
الرسومية " .. فظهرت مقالات وتطبیقات تستفيد فعلاً من إمكانية ل6۲ › لم ننتظر طویلاً حتی ظهرت 9۸ل و ا٣٣‏ ٥م0‏ و مكتبة Dit‏ 
Compute‏ . 


CUDA» Ope nCL_ _عبlرئا المرحلة‎ 


ظهرت الحاجة لمكتبة قياسية تستفيد من العدد الضخم من الأنوية ءهإهء وبالتالي تطبيق مبدأً البرمجة المتوازية › بل والاستفادة من قدرات ل6۲ 
الحسابية السريعة و الدقيقة » حتى لو لم يكن التطبيق رسومي. 


2 مصنعو البطاقات الرسومية بتطوير قدرات ل۲ › > ليخدم قطاعات أخرى > ولعل خطوة شركة انفيديا NVidia‏ في هذا المجال هي الأبرز من 
حيث تطوير C0۸‏ وهي معمارية ظهرت على يد شركة انفيديا كا۷" وتعمل على بطاقات انفيديا الرسومية › و يمكن من خلالها تطوير تطبيقات 
ع ا وت رر ا ا ےا رر وکا م او مر ارد م کال ةع ریت ری 


ومن ثم ظهرت مکتبة Ope ۸٣1‏ من مختبرات Apple‏ والتي أصبحت الآن تحت عهدة ۸۲0٣0١‏ نفس الجهة التي تشرف على مواصفات OpenGL‏ 
> وبالتالي أصبحت مكتبة قياسية يشارك في وضع قياساتها ومن ثم عمل 0ة "معام لها > عدة شركات ضخمة gs AMD, |BM, |ntel,‏ 
Nvidia‏ بالإضافة ل ماممA‏ طبعا. 


تتميز ا٣"‏ هم0 بقدرتها على العمل على أي قطعة, 2۲٥‏ سهم التي تسمی م»م0 » فهي قد تعمل علی ل۲ وتستفید من .. ل۴٤‏ ۵٣٥ء۔-آt‏ اا , وقد 
تعمل على ل۲ . علماً أن عدد " أنوية " المعالج المركزي لام قد تصل لثمانية أنوية أو أقل من هذا أما في ال لا٥ت‏ فأنت أمام عشرات ومئات 
الأنوية التي تتسابق لخدمتك . 

Open‏ و U0۸‏ لهما نفس الهدف تقريباً. ولكن التوجه الآن هو بدعم ا٤"‏ ٠م0‏ بشكل كامل » باعتبارها قياسية وستعمل على أكثر من بطاقة 
رسومية وعلى أكثر من نظام تشغيل » بل وحتى على أكثر من لغة برمجية . بالتالي أصبحنا بغنى عن التطفل على مبرمجي الرسوميات واستخدام 
أدواتهم مثل لغة 151ات أو 1151 لاستغلال قَوّة ل6۲ في أمور غير رسومية » بل هناك ما يسمى ب اع١۲٠)‏ في ا٣"عم0‏ وهي لغة خاصة صممت لهذا 
الغرض ( مبنية على مواصفات لغة سي ). 
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CPU Vs GPGPU 


Control 


: L2 Cache 
Logic 


ALU L1 Cache 


~ 256GBPS 


System Memory 


يتم تخصيص مساحة لا بأس بها لقسم التحكم 1 او اr0 cont‏ 
اها عوضا عن تخصيص مساحة اكبر لقسم المنطق 
والعمليات الحسابية لا۸. 

يوجد عدة مستويات للخبيئة تستعمل للتقليل من التاخير 
الزمني الحاصل من عمليات النقل. 

عدد محدود من السجلات بسبب عدد النياسب sلجم1۲‏ 
المفعلة القليلة نسبياً. 

يهتم بالتاخير الزمني لنيسب واحد . 

التحكم بالمنطق لاعادة ترتيب تنفيذ التعليمات 

يتم تحسينها من اجل عمل مهمة واحدة 

تسلسل تنفيذ التعليمات غير مرتب حسب الورودء كما ان 
التنبؤ بالتفرع والقفز والخابية تاخذ معظم حجم الشريحة . 


معمارية معالج ل٥6۲6‏ حديث 
GBPS 1‏ 150 


On Board System Memory 


ا 150 1 


Cache 


SnIv a|du!s 


ماس الل خفن اتك و المنطق و الاش 

تحوي عدد كبير من الانوية البسيطة وماهع 

يحوي العديد الانوية المعالجة. 

ملف سجلات اكبر لدعم عدد اكبر من النياسب 

زمن تاخير قليل بسبب دعم عتادي الذي ينظم التبديل بين 
النياسب 

عدد كبير من وحدات الحساب ل۸1 لكل نواة ممع مع عدد 
محدد من الخابيات "٥٠طعهع‏ " لكل نواة . 

ممر الذاكرة محسن من اجل تحسين عرض الحزمة 


ما هي تقنية €1 مم0 


اù Open Computing Language" OpenCı!‏ " هي منصة عمل ' کما یمکننا القول بانها معايير مواصفات ۸٥10اةء!fزءعمء‏ "مخصصة لكتابة 
برامج التي تنفذ على منصات هجينة تحوي وحدة معالجة مركزية ل۲٥‏ كما تحوي وحدة معالجة بيانات 6۲ ومعالجات اخرى .يهدف هذا المعيار 
الى كتابة برامج تستفيد من القوة الحسابية للمعالجات سواء كانت معالجات C۴1‏ او ل6۲ او حتى معالجات الآلة الحاسبة البسيط وتهدف بشكل آخر 
الى استثمار موارد الحاسب الى اقصى حد ممكن .تقدم 1ا٣مءم0‏ حوسبة تفرعية من خلال مفهومي التوازي على مستوى المهام وعلى مستوى المعطيات 
. وتم تضمین معاییر "٣1‏ عم0 في کروت الاظهار من قبل کلا ۸۷15/۸11 باسم SDK‏ mھعS)r؛ء‏ وقامت إنفیدیا زل¡ N۷‏ بتقدیم ٣1‏ عم0 کمثیله 
Compute Unified Device Architecture" CUDA‏ " وقامت مایکروسوفت بتضمين هذه المعاڀير ڊاسم .DirectCompute‏ 


تضمن ۸٣1‏ عم لأي تطبيق بإمكانية استغلال وحدة المعالجة البيانية ا6 لأغراض لا تتعلق بالإظهار والغرافيكس .وهكذا يقوم 1٣٥ص0‏ باستغلال 
امكانيات كرت الاظهار الضخمة جدا في عمليات المعالجة للمعالجة العامة التي لا تختص الغرافيكس فحسب . 


یوجد تشابه کبیر بین 1٣۸عم0‏ وتقنیات مثل ا۸6 عم0 و1[ ۸۸عم0 كمعايير صناعية .ویتم ادارة ھذہ المعاییر من قبل مجمو عة ومر ٥ط‏ .كما يجدر 
الذكر بان شركة آبل هي من قامت باقتراح هذا المعيار . 


الصورة التالية توضح ان معيار 01ر مم0 هو معيار صناعي وبرمجي نتج عن التقاطع بين امكانية معالجة وحدة المعالجة المركزية وبين امكانية معالجة 
وحدة المعالجة البيانية . 


Processor Parallelism 


CPUs GPUs 
e 
Intersection - numerical precision 
۱ 
OpenCL 
Heterogenous 
Computin: 
Multi«processor P 9 Graphics APls 


programming - 


4 and Shading 
e.g. OpenMP 


Languages 


OpenCL - Open Computing Language 
Open, royalty-free standard for portable, parallel programming of heterogeneous 
parallel computing CPUs, GPUs, and other processors 


الشكل التالي يوضح آلية عمل [٤"عم0‏ بشكل مبسط : 


Kernel Code Program 


kernel void 
horizontal reflect (read only image2d t src, ۰ 
5 write only image2d_t dat) Compile for 
{ 
int x = get global id(0); // x-coord 
int y = get_global_id(1); // y-coord 
int width = get image width (src) ; 


float4 src val = read imagef (src, sampler, 


(int2) (width-1-x, y)) ; Compile for 


write imagef (dst, (int2) (x, y), src_ val); 


ماه الفكرة الجديدة التي جاء بها معيار OpenCl‏ ؟ 

تم استبدال الحلقات ومه٠ه|‏ بالتوابع (نواة امم٣ع))‏ بحيث يتم تنفيذ هذه التوابع كل في مجاله . متال لنفرض اننا نريد معالجة صورة 1024*1024 
بتشغيل نواة واحدة لكل بيكسل او 1048576 عملية تنفيذ للانوية بتقسيم معين لكل بكسل .عندها فان كل نواة ضمن ال ل6۲ يمكن ان تفيد بهذه العملية 
رباكا قارف الزن هائل بن لتقد التم فمل و التففة على التراز ى مهر الأكر ان وك المعالجة الياة تخري عددذ شخ من الاترية الالح 


Traditional loops Data Parallel OpenCL 
void kernel void 
trad _ mul (int n, dp_mul (global const float *a, 
const float *a, global const float *b, 
const float *b, ا‎ global float *c) 
float *c) { 
1 int id = get global id(0) ; 
iRE Û? 
FOE (=0; 1m; 11¥) CIA] = a1a] * Bld} 
اا ا > اا‎ 
} } // execute over “n” work-items 1 


OpenCL Ii‏ ؟ 


1- القوة الحسابية انتقلت من سرعة الساعة الى النوى ٥٠۲٠5‏ .بعدما وصلت ترددات ساعة المعالجات الى طريق مسدود تقريبا لذا تم الاعتماد على 
انشاء عدة انوية تخدم المتطلبات الكبيرة للمعالجة والحساب . 


2- بسبب توفر العديد من المعالجات ل٥‏ و الرغبة بوحدة معالجة بيانية ل٥‏ قابلة للبرمجة . 

3- الحاجة الى واجهة برمجية التي تسمح للمستخدم باستغلال الموارد بشكل سهل . 

هه دخ اليزمجة اقفر ية للأغراضن العامة . 

5- مصممة لتكون ءاوه" عه مء ۷م اي يمكن لأي تطبيق للمعايير ان يعمل على اي معالج دون آخر . 

6-كمعيار مفتوح يجب ان يكون الرماز المصدري البرمجي يجب ان يتميز بالمحمولية بان يعمل على نظام ويندوز وابل وغيره . 
7-لاتوجد شركة محددة تتحكم بوضع المعايير . 
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الاجهزة التي تدعم إا€" Ope‏ 


غالبا ما يتم التعامل مع وحدة المعالجة المركزية C٥‏ ووحدة المعالجة البيانية ا6۲ ولكن يمكن التعامل مع اي جهاز يدعم المواصفات 
الدنيا من المعايير فيمكن ان يكون Multimedia Chip, FPGA, Embedded processors‏ واي جھاز یدعم هذہ المعاییر .فأقوی میزة 
في هذا المعيار هو انه يمكنك ان تكتب برنامجك بالشكل الطبيعي ,وتجد انه يعمل على اي جهاز يدعم وحدة لمعالجة المعطيات . 


الھدف من Ope nC|‏ 
1-يهدف هذا المعيار ان يكون نموذج بسيط للحساب ومكتبة برمجية|۸۴ سهلة التعامل 
2-دعم لغة ۸۸51-٨99‏ بحيث تم اضافة انماط معطيات وتوابع اخرى . 
3-بيئة عمل لإدارة النياسب rhrea4 management framework‏ فلیس عليك ان تھتم بإنشاء او حذف النیاسب فمنصة ۸٤٣1‏ مم0 
ستقوم بهذا العمل نيابة عنك . 
4-سهل الاستعمال ويجب ان يكون خفيف على الجهاز وفعال . 
5-الحاجة الى استعمال جميع الموارد الحسابية في الكمبيوتر . 
6-اقل قدر من الاخطاء للتوابع الرياضية بحيث نعلم ان المعالج بشكل عام يقوم ببعض الاخطاء فيما يتعلق بأمور كالفاصلة العائمة بسبب 
طريقة ترميز الاعداد . 


OpenCl| تIںlnعتwl‎ 


1-معالجة الصورة ¢ الفيدير والصوت 
2-عمليات المحاكاة والحسابات العلمية . 


اللوير الي واي اك كم شك جد من الاك اى تاج اة 
4-النماذج المالية والبورصة. بحيث توجد العديد من المعطيات المالية المتغيرة كل ثانية وتحتاج الى معالجة كبيرة لكي تكون عماجل هغ مںu‏ 


OpenCl & OpenGL 


1 م0 صمم ليكون متوافق بشكل كبير مع |۸6٥م0‏ بحيث يمكن تبادل المعطيات الناتجة عن الحسابات من ا٣"‏ ٠عم0‏ الى مكتبة الاظهار بحيث 
الكامل النكتين ما ين الاظهار ر المعالحة اقرخ ممل الر تع ٠‏ 


ما الحالات التي لا تناسب استعمال Ope n٥|‏ 


1-شأنها شان اي مسالة تفرعية في حال كانت المسالة المحلولة لاتحل بطريقة تفرعية وانما بشكل تسلسلي بحت فنجد ان ٤٣٠ص0‏ لن يؤثر على الاداء 
بشکل فعال . 


2-الحسابات التي تتطلب العديد من المؤشرات المترابطة التي تتعامل كثيرا مع حالات كالدخل والخرج (تعامل مع القرص الصلب مثلا ) . 


3-الحسابات التي تتطلب الكثير من الاتصال والارتباط ونتائج التحديث بحيث خرج الاول هو دخل للثاني بحيث نريد ان نجد معطيات مستقلة بأكبر 


بنیة برنامج 1ا٣۸‏ عم 0 
يقسم برنامج ا٣"‏ هم0 الى قسمين 


1- كود المضیف ئ۳۲0 
رماز مصدري بلغة ++ء/ء الذي سيعمل على الام »› يتم ترجمته باستعمال المترجمات التقليدية + ا٣"‏ مم0 
Headers‏ 
یستعمل ۸۲۱ ا٣عم0‏ من اجل : 
» نقل المعطيات من ذاكرة النظام الى ذاكرة كرت الاظهار 0۸۸۷ ل6۲ 
« بيدأ بتشغيل عدة نسخ من النواة ليعمل على ال ل6۲ 
« كل نسخة مولدة تعمل على جزء من المعطيات المطلوبة 
تعيد المعطيات بعد نسخ النتائج 
2- کود النواة ع" )e٣‏ 
« رماز مصدري بلغة ع الذي سيعمل على ل6۲ » يتم ترجمته باستعمال مترجمات خاصة وفق الشركة المنتجة متل 
مترجم إنفيديا. 
» يتعامل مع المعطيات المخزنة في ذاكرة كرت الاظهار 
« يکتب النتائج في ذاکرة کرت الاظهار 5۸۸ ۲۷ 6. 


نموذج إنفیديا أوبن سى إJ NVidia Ope nCL‏ 
e‏ ے 
ميزات نموذج إنفيديا دال¡ 12179 


: دعم انظمة التشغيل‎ -1 
32 and 64 bit Windows XP and Vista (and soon Win 7) " 
32 and 64 bit Linux (Ubuntu, RHEL, etc.) " 
Mac OS X Snow Leopard (indirectly via Apple) " 


: 15٤ 2۔ بیئة التطویر‎ 
Visual Studio 2005 (8) and Visual Studio 2008 (9) for Windows " 
GCC for Linux " 
برامج التعريف والكومبايلر‎ 3 
In SDK for Alpha & Beta "= 
يتم توفير برامج التعريف ضمن قرص تعريف كرت الاظهار‎ » 


Source code & white papers for sample applications (30 presently) " 
Documentation: Getting Started Guide, Programming Manual, " 
Best Practices (Optimization) Guide =" 


